形成系統性風險的潛在因素:
資料
資料的經濟性聚合將導致集中的單一來源增加,從而通過羊群通道和網路互連通道增加風險。
指數資料的增長和使用,引入了時間序列尾部風險的顯著潛在一致性。
對資料的永不滿足的需求可能會通過依賴集中的資料聚合器而導致一致性和網路互連性的增加。
由於越來越多地使用小樣本的替代資料而增加潛在的特徵風險。
具有主導影響力的資料集中趨勢,有很大程度上歸因於資料的規模經濟、範圍經濟和網路效應。
大型資料:
ImageNet 是視覺識別研究領域學術研究的主要資料集。
谷歌地圖、谷歌地球及其附屬公司 Waze 主導著路線優化業務和相關交通資料集。
私有資料:
例如:在信用卡行業,詳細的消費者資料受到嚴密保護。
共享的基礎資料集以及能夠構建集中主導資料集的參與者。
資料驅動:
例如:中國的微信和支付寶都建立了占主導地位的集中資料集。
雖然這可能會帶來更好的價格發現和高效的交易,但也可能會帶來“盲盒經濟”。
模型設計
最佳模型類型選擇、歸納偏差和超參數選擇方面的共識的發展導致一致性,即所謂的“單一模型”。
人工智能即服務提供商的出現——特別是那些提供特定模型的提供商——也可能會增加網路互連性。
由於其非線性、超維性和復雜性以及短時間範圍資料集的依賴,可能提高模型的尾部風險。
量化危機:
過度依賴三大風險評估機構標準普爾(S&P)、穆迪和惠譽來承銷抵押債務債券 (CDO)。
高頻交易中的羊群效應和擁擠現象是造成閃電崩盤、高度波動以及證券定價快速突破的部分原因。
學徒效應:
接受過構建和管理這些模型培訓的人並不多,而且他們往往具有相當相似的背景。
由於所有這些原因,隨著時間的推移,模型的歸納偏差可能會變得更加均勻。
由於監管要求的標準化解決了可解釋性、公平性和穩健性的挑戰,也可能出現模型統一性。
這可能是要遵守的特定公平公式或實現更好可解釋性的超參數設置。
當在同一部門運營的機構針對相似的利潤函數進行優化時,可能會出現難以解決的一致性問題。
任何這些共識來源都會導致模型多樣性的喪失。
技術依賴:
在不確定的模型環境中,初始化模型和超參數的差異可能會導致結果更加多樣化。
財務透明度較低可能會降低模型設計快速收斂的可能性。
隨著金融部門獲得更多經驗,並且深度學習得到更充分的採用,可能會就超參數的選擇達成共識。
例如:學習模型的類型、以及損失函數的選擇。
Kaggle 競賽已經表現出對隨機梯度提升樹(SGBT)、CNN、RNN 以及 Transformers 的偏愛。
規模經濟:
由於訓練大型、密集的網路需要大量的計算能力。
大型機構也許能夠提供必要的資源,從頭開始構建自己的定制模型。
規模較小機構可能會使用人工智能即服務提供商,因為他們無力構建和訓練自己的所有模型。
導致人工智能即服務提供商的集中,從而增加模型開發統一方法和預測決策潛在統一性的機會。
模型單一:
例如:大多數金融市場參與者相當依賴 Black-Scholes-Merton 期權定價模型。
第三方服務提供商和金融科技服務的依賴增加。
對外部軟體的依賴越來越大。
有一些框架可以讓構建自定義模型變得更容易,包括 Kubeflow、TensorFlow 和 Keras。
模型特徵:
非線性和超維性使得它們在一定的輸入範圍內可能更加敏感,在範圍之外則不太可能表現良好。
這些模型通常還會在與替代資料相關的短資料集上進行訓練。
模型可能更頻繁地陷入局部極小值,更大的超出範圍的尾部,導致所謂的“肥尾”和“黑天鵝”事件。
一個模型風險管理制度的制定非常重要。
監管
可解釋性、公平性和穩健性的挑戰導致監管差異,監管設計促進了模型的同質性。
監管方法可能會無意中導致模型單一化。
包括欺詐檢測、反放貸檢測、壓力測試和宏觀審慎監控。
監管模型可能會在不知不覺中促進其監管的主體的一致性。
在金融領域,金融監管機構將被要求幫助制定其使用標準。
以滿足法律和監管合規性的可解釋性、公平性和穩健性挑戰。
這可能會導致單一模型和對服務提供商的集中依賴。
監管套利:
從而使金融部門內的某些活動轉移到監管較少的參與者身上。
金融穩定性可能會受到這種分歧的影響,因為大部分業務都處於支持更深度學習的核心系統之外。
穩健問題:
如果監管模型受到干擾或愚弄,可能會給系統帶來巨大的風險。
充足、適當的資本、流動性和風險管理是整個金融體係安全穩健的基礎。